[计量] 嵌套与非嵌套模型

这是一篇关于模型设定和诊断检验的梳理

Posted by Leung ZhengHua on 2017-12-07

本文总点击量

概念

在进行设定检验时,区分嵌套(nested)非嵌套模型(non-nested models)有助于我们继续下面的讨论。

模型A:$Y_i=\beta_1+\beta_2 X_{2i}+\beta_3 X_{3i}+\beta_4 X_{4i}+\beta_5 X_{5i}+u_i$
模型B:$Y_i=\beta_1+\beta_2 X_{2i}+\beta_3 X_{3i}+u_i$

我们说模型B包含于(被嵌套在)模型A中,也就是模型A更全面,包含更多信息;模型B可以看做是模型A的一种特殊情形。

现在考虑非嵌套模型,

模型C:$Y_i=\alpha_1+\alpha_2 X_{2i}+\alpha_3 X_{3i}+u_i$
模型D:$Y_i=\beta_1+\beta_2 Z_{2i}+\beta_3 Z_{3i}+v_i$

其中$X$和$Z$代表不同的变量,我们说模型C和模型D是非嵌套的。

即使模型中变量一样,不同的函数形式也可能使得两个模型变成非嵌套模型,比如:

$Y_i=\beta_1+\beta_2 lnZ_{2i}+\beta_3 lnZ_{3i}+w_i$

模型D和模型E仍然是非嵌套模型,因为不能把其中一个模型作为另一个模型的特殊情形推导出来。

非嵌套模型的检验

检验非嵌套假设的方法大概分为两类,给定两个或者多个模型,我们根据某些拟合优度准则选择其一(判别方法),这是我们经常用到的。然而,有一种方法可以考虑其他模型提供的补充信息,而不是单单对各个模型做个回归,然后根据某个R方选择模型(辨识方法)。

判别方法(discrimination approach)

$R^2$

它度量的是样本内拟合优度,不能保证对样本外观测(out of sample)也能很好地预测;其次,比较两个$R^2$,因变量或回归子必须相同;最后,$R^2$没有对回归元个数做惩罚,变量越多,$R^2$越大。

调整$R^2$

同样,被比较模型的回归子必须相同

AIC

$k$为包含截距项的回归元个数,$n$为观测次数,上式可以写为更简洁的形式

AIC准则相比于调整$R^2$对回归元个数施加了更严厉的惩罚,它不仅适用于样本内预测,也适用于预测回归模型在样本外的表现;它对嵌套和非嵌套模型都适用,甚至还可以决定自回归模型AR(p)中的滞后长度。

SIC

SIC和AIC有什么不一样?那就是相对于AIC,SIC对回归元个数施加了更严厉的惩罚!

Mallow’s $C_p$ criterion

这个模型的用法跟正态Q检验的Q图一样,哪个模型表示的点更靠近直线$C_p=p$,哪个就更受欢迎。

考虑一个含有包括截距项的k元回归模型,但我们选择了其中p个回归元作回归,得到RSS,令$RSS_p$表示使用p个回归元的残差平方和。$C_p$准则如下:

其中$\hat{\sigma}^2$是真实$\sigma^2$的估计量,如果含有p个回归元的模型拟合得足够充分,那么可以证明$E(RSS_p)=(n-p)\sigma^2$,因此近似有

用于预测的$\chi^2$

把数据留存一部分分析对样本外的预测表现,预测$\chi^2$检验的定义如下:

其中,$\hat{u}_i^2$表示第i期(样本外的第$n+1,n+2,…,n+t$)的预测误差,$\hat{\sigma}^2$是$\sigma$的通常OLS估计量。

辨识方法(discerning approach)

非嵌套F检验(包容F检验)

考虑模型F:$T_i=\lambda_1+\lambda_2 X_{2i}+\lambda_3 X_{3i}+\lambda_4 Z_{2i}+\lambda_5 Z_{2i}+u_i$

显然,模型F同时包含了模型C和模型D,而这两个模型是非嵌套的。如果模型C是正确的,那么$\lambda_4=\lambda_5=0$;如果模型D是正确的,那么$\lambda_2=\lambda_3=0$。用通常的F检验就可以解决这个问题,非嵌套F检验由此得名。

然而,这么简单就能实现的检验是会有与之相称的问题存在的:

  • 解释变量$X$和$Z$高度相关时,多重共线性可能使得一个或多个$\lambda$系数在统计上不显著,我们无法决定模型C正确还是模型D正确

  • 假设我们选取模型C作为参考假设(模型),并发现它所有系数显著,而加入一个或两个$Z$变量到模型中,并通过F检验发现加入的变量对解释平方和的增补贡献不显著,因此决定选择模型C;反之取模型D作为参考假设也有同样结论,决定选择模型D,最后不能得到满意的模型。

  • 人为的嵌套模型F缺乏经济学意义

戴维森-麦金农J检验

作为非嵌套F检验的改进,考虑步骤如下:

  • 1 估计模型D并由此得到$Y$的估计值$\hat{Y}_i^D$

  • 2 将步骤1得到的估计值作为新的回归元增补到模型C中,并估计如下模型:

  • 3 用t检验对假设$\alpha_4=0$进行检验

  • 4 如果假设$\alpha_4$ 不被拒绝,就可接受模型C为真模型。因为模型D不含有足以改进模型C的任何额外信息,故模型C兼容模型D

  • 5 交换模型C和模型D的位置,以决定模型D是否胜过模型C。

当两模型均被拒绝时,任一模型都无助于对$Y$行为的解释;如两模型都被接受,则“数据还未充分足以辨别两个假设的地步”

J检验的另一个问题是,使用t检验时,t统计量只是渐近地在大样本中遵从标准正态正态分布。因此在小样本中,J检验会过多地拒绝真假设。